Probabilidad Computacional y Estadística

Ingeniería de software y computación

Ph.D. Pablo Eduardo Caicedo Rodríguez

2023-08-01

Probabilidad Computacional y Estadística

El Profesor

Educación

Doctor en Ciencias de la Electrónica. Magister en Ingeniería Electrónica y Telecomunicaciones Ingeniero en Electrónica y Telecomunicaciones

Intereses

Biomecánica, Dispositivos para el análisis de movimiento humano, ciencia de los datos.

Desempeño

Profesor de la Facultad de Ingeniería

Invest. Línea de Percep. Avanz. y Robótica – GITA

Director Grupo de Investigación MEDES.

Contacto:

pablo.caicedo.r@uniautonoma.edu.co

Contenido del curso

  1. Introducción a la probabilidad y la estadística.
  2. Análisis exploratorio de datos.
  3. Modelos básicos de representación estadística.

Evaluación

  1. Varios 001. Quices y talleres (15%) (Lo puedo cambiar!!!)
  2. Parcial 002. Probabilidad, conteo y funciones de densidad de probabilidad (20%)
  3. Parcial 003. Análisis de datos a partir de estadística descriptiva (20%)
  4. Consigna 004. Proyecto Final (45%)

Recursos

Clases

Lunes, Miércoles y Viernes 9:00 – 11:00 Sala 502

Grupo Teams

Software

Interpretes: R.

IDE: Visual Studio Code, Google Colaboratory R, RStudio, PyCharm, Dataspell

Seguimiento de Aprendizaje: Moodle

Bibliografía

  1. P. Dangeti, Statistics for Machine Learning. 2017.

  2. A. P. Field, J. Miles, and Z. Field, Discovering statistics using R. London; Thousand Oaks, Calif.: Sage, 2012.

  3. D. Forsyth, Probability and Statistics for Computer Science. Cham: Springer International Publishing, 2018.

  4. C. Guisande González, A. Vaamonde Liste, and A. Barreiro Felpeto, Tratamiento de datos con R, Statistica y SPSS. 2013.

  5. C. Heumann, M. Schomaker, and Shalabh, Introduction to Statistics and Data Analysis. Cham: Springer International Publishing, 2016.

  6. N. S. Matloff, Probability and statistics for data science: math + R + data. Boca Raton: CRC Press, Taylor & Francis Group, 2019.

  7. W. Menhenhall, R. Beaver, and B. Beaver, Introducción a la probabilidad y estadística. 2016.

  8. M. R. C. Rubio, Estadística con aplicaciones en R. Bogotá: Fundacion Universidad de Bogota Jorge Tadeo Lozano, 2019.

  9. P. Bruce, A. Bruce, y P. Gedeck, Practical Statistics for Data Scientists, Segunda Edición. Sebastopol, CA: O’Reilly, 2020.

Introducción a R

Que es R?

Un poquito de historia y herramientas

Consejo

  • Creado en 1993 por Robert Gentleman y Ross Ihaka en la universidad de Auckland (Nueva Zelanda)
  • En la actualidad: miles de personas en todo el mundo que colaboran en su desarrollo
  • Propósito: contar con una plataforma libre y gratuita para desarrollar algoritmos numéricos y estadísticos

Consejo

RStudio

Es un IDE (Entorno de Desarrollo Integrado): permite utilizar R de manera más cómoda en algunos aspectos

Otro poquito de herramientas

Google Colaboratory R

Permite escribir y ejecutar código de R en tu navegador, con

  • Sin configuración requerida
  • Acceso sin costo a GPU
  • Facilidad para compartir

Deepnote

Similar a Google Colaboratory R, sin embargo permite el trabajo colaborativo más fácilmente. Acceso a licencia educativa con su correo electrónico de la Universidad

Instalación de R…. solo windows

Operaciones básicas

  • Cursor por defecto en la consola: símbolo ““>”” indica que R está listo para recibir y ejecutar un comando.
  • Comentarios: símbolo ““#””
  • Operaciones matemáticas elementales: Suma(+), resta(-), división(/), multiplicación(*), potenciación(^), cociente entero(%/%), resto de la división(%%).
  • Operaciones lógicas elementales: Menor que(<), Menor igual que(<=), Mayor que(>), Mayor igual que(>=), igual(==), distinto(!=).
  • Funciones: conjunto de instrucciones que convierten las entradas (inputs) en resultados (outputs); pueden ser matemáticas, estadísticas, manejo de caracteres, etc. Puede construir nuevas. Algunas son:
  • \(e^x\): exp(x)
  • \(ln\left( x \right)\): log(x)
  • \(log_{n} \left( x \right)\): log(x,n)
  • \(log_{10} \left( x \right)\): log10(x)
  • \(\sqrt{x}\): sqrt(x)
  • \(x!\): factorial(x)
  • Entero anterior a x: floor(x)
  • Próximo entero de x: ceiling(x)
  • Valor entero próximo a x, ubicado entre \(\left[ 0,x \right]\): trunc(x)
  • Redondear el valor de x a 4 decimales: round(x, digits=4)
  • Valor de x en notación científica con 3 dígitos decimales: signif(x, digits=3)
  • \(cos{x}\), x en radianes: cos(x)
  • \(sin{x}\), x en radianes: sin(x)
  • \(tan{x}\), x en radianes: tan(x)
  • \(\lvert x \rvert\): abs(x)

Tipos de datos

Consejo

Variable

  • Objeto que puede cambiar de valor se crea con el operador <-
  • Nombre: inicia con una letra, puede contener números, puntos
  • Diferencia entre mayúsculas y minúsculas
  • Después de hacer la asignación los valores pueden ser usados

Consejo

Vector

  • Colección ordenada y modificable de elementos del mismo tipo
  • Cada elemento tiene un índice.
  • Varias formas de crearlos
  • Se pueden ejecutar operaciones sobre los elementos o entre vectores
  • Valores nulos : NA

Consejo

Matriz

  • Vector multidimensional: filas y columnas
  • Estructura con forma rectangular
  • Contiene un sólo tipo de datos

Consejo

Data Frame

  • Estructura de datos de dos dimensiones: puede contener datos de diferentes tipos
  • Objeto más habitual para almacenar datos en R
  • Las filas representan casos; las columnas representan atributos o variables
  • Usada para realizar análisis de datos

Introducción a la probabilidad

Que es la probabilidad?

Incertidumbre

Toma de decisiones con información incompleta

Ejemplo

Juegos de azar. No hay forma clara para determinar un procedimiento que nos lleve a la victoria siempre.